بهبود عملکرد حمله در تیم رباتهای فوتبالیست با استفاده از یادگیری تقویتی
Authors
Abstract:
بهدلیل عدم امکان پیشبینی همه وضعیتهای ممکن برای عاملها در یک سیستم چندعاملهی پویا و گسترده، روشهای یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عاملها میباشد. فوتبال شبیهسازی شده رباتها یک مسئله شناختهشده برای ارزیابی الگوریتمهای یادگیری ماشین روی سیستمهای چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتمهای معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رباتهای فوتبالیست دو بعدی بکار گرفته شدهاست. سیگنال تقویتی براساس اینکه بازیکنانی که در حمله دخالت دارند، توپ را جلوی دروازه میرسانند، یا اینکه توپ را از دست میدهند، تعریف شدهاست و بهترتیب عاملها با توجه به وضعیت ذکرشده، جایزه و جریمه دریافت میکنند. جهت بهبود عملکرد از ایده تقسیم سیگنال تقویتی متناسب با مقدار خبرگی عاملها در یک سیستم چندعامله استفاده شدهاست. در اینجا میزان خبرگی متناسب با تفاوت ارزش عملِ با بالاترین ارزش با ارزشِ عملِ با کمترین مقدار ارزش در هر حالت تعریف میشود. نتایج شبیهسازی نشان میدهد، بهرهگیری از ایده تقسیم سیگنال تقویتی براساس خبرگی در آموزش باعث افزایش سرعت در آموزش و بهبود عملکرد عاملها شدهاست.
similar resources
بهبود عملکرد عاملها در جامعه مصنوعی با استفاده از یادگیری تقویتی
چکیده معمولاً در سیستمهای چندعاملی، تعاملات بین عاملها و تعاملات عاملها با محیط، به صورت انتخاب و اجرای عملهایی از بین مجموعهای محدود از اَعمال مشخص توسط عاملها حاصل میشود. بنابراین نوع و میزان پیچیدگی رفتارهای پیدایشی حاصل از این تعاملات نیز به نحوه اجرا و تعداد رفتارهای قابل اجرا توسط عاملها وابسته است. در این پژوهش سعی شد با توسعه مدل کسب و انتقال تجربه و اضافه کردن قابلیت یادگیری به ...
full textاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
full textاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
full textیادگیری تقویتی برای ربات های فوتبالیست
مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...
پیشبینی روند حرکتی قیمت سهام با استفاده از XCS مبتنی بر الگوریتم ژنتیک و یادگیری تقویتی
پیشرفتها در حوزۀ هوش مصنوعی و یادگیری ماشین بهخصوص درزمینۀ محاسبات تکاملی نهتنها ما را قادر به تجزیهوتحلیل مؤثرتر دادهها نموده است، بلکه این امکان را فراهم ساخته که از آنها برای فهم هرگونه الگوی زیربنایی بازارهای مالی استفاده گردد. اقتصاددانان، آماردانان و مدرسان امور مالی همواره علاقهمند به توسعه و آزمایش مدلهای رفتاری قیمت سهام بودهاند. XCS سامانهای مرکب از الگوریتم ژنتیک و یادگیری ...
full textتنظیم خودکار سختی بازیهای توانبخشی با استفاده از روش یادگیری تقویتی چندتناوبی (یاقوت)
تحقیقات نشان داده است که طراحی فعالیتهای توانبخشی در قالب بازیهای جدی میتواند منجر به انگیزش بیشتر در بیماران شود. درجه سختی چنین بازیهایی معمولاً بهصورت دستی توسط درمانگر تنظیم میشود. این در حالی است که بازیهای توانبخشی خانگی نیاز به تنظیم خودکار درجه سختی متناسب با مهارتهای بیماران دارند. این مقاله روشی برای تنظیم درجه سختی بازیهای توانبخشی ارائه میکند که در آن سختی بازی بهصورت ...
full textMy Resources
Journal title
volume 48 issue 2
pages 585- 594
publication date 2018-08-23
By following a journal you will be notified via email when a new issue of this journal is published.
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023